Información colocacional y recuperación de la información

نویسندگان

  • Margarita Alonso Ramos
  • Leo Wanner
چکیده

Este proyecto tiene como objetivo investigar la significación de la información colocacional en Recuperación de la información (RI). Una colocación es una relación entre dos unidades léxicas (UL) L1 y L2 tal que para expresar un significado específico en relación con L1 la elección de L2 no es libre (Mel' uk 1995). Así, para expresar el sentido 'hacer lo que está previsto que se debe hacer' en relación con la UL CARGO, podemos decir desempeñar un cargo. El mismo sentido predicado de PROMESA se expresaría por CUMPLIR y en combinación con SECRETO, por GUARDAR. El peso semántico de L1 y L2 no está equilibrado: mientras L1 (la base de la colocación) guarda el sentido que tiene cuando no está en colocación, el significado de L2 (el colocativo) está reducido o modificado cuando aparece en colocación Las siguientes propiedades de las colocaciones las hacen interesantes para RI: 1) A la hora de indexar un texto, los elementos de una colocación no pueden ser considerados como términos aislados: es evidente que la aportación de ABANDONAR en abandonó al niño, donde la UL es usada libremente, no es la misma que la aportada en la colocación abandonó el cargo; 2) Una base dada puede formar varias colocaciones con el mismo significado. Así, el nombre CARGO no sólo selecciona ABANDONAR, sino también RENUNCIAR, DIMITIR (de) o CESAR (en). 3) Las colocaciones pueden der clasificadas según una tipología semánticamente motivada. Nuestra hipótesis es que estas propiedades deben tener ciertos efectos en los resultados de la RI. A pesar de que en los últimos años se registra una fuerte tendencia a utilizar información lingüística para RI, no se han explorado hasta ahora las colocaciones. La razón se debe a que no existía ningún procedimiento fiable de reconocimiento automático de colocaciones en los documentos. Sin embargo, algunos trabajos previos basados en la tipología de las funciones léxicas (FL) (Wanner y Alonso 2001 y Wanner en preparación) han mostrado la posibilidad de identificar automáticamente colocaciones verbo-nombre. Actualmente hemos extendido el mismo enfoque para reconocer colocacaciones nombre-adjetivo y verbo-adverbio. En nuestra investigación sobre RI, usamos esta estrategia para la identificación de colocaciones tanto en los documentos como en las consultas de los usuarios y pretendemos usar la información colocacional para mejorar los resultados de RI.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Distinción semántica de compuestos léxicos en Recuperación de información

Resumen: La consideración de sintagmas no parece producir mejoras significativas en los modelos clásicos de Recuperación de Información. En general, se acepta que los criterios de proximidad proporcionan mejores resultados que un criterio de adyacencia. El trabajo que se presenta explora la hipótesis de que no todos los compuestos léxicos deben considerarse de la misma forma. Se propone un proc...

متن کامل

[Google: Searches, analyses and networking in the health care environment].

La enfermerı́a, como todas las disciplinas de las Ciencias de la Salud, se encuentra en constante cambio y requiere de un gran esfuerzo investigador y formativo por parte de sus profesionales para garantizar la mejor atención y los mejores cuidados. El acceso al mejor conocimiento cientı́fico disponible y las Tecnologı́as de la Información y Comunicación (TIC) juegan un papel fundamental en esta p...

متن کامل

Una Plataforma Colaborativa de Recuperación de Información

El número creciente de información disponible a través de la Internet hace necesarias herramientas para la selección de los datos a los cuales se desea acceder. Por otra parte la posibilidad de compartir datos e información permite el desarrollo de sistemas para el soporte de la colaboración entre usuarios. Este trabajo presenta una plataforma de recuperación de información colaborativa para la...

متن کامل

Primera aproximación de un sistema de recuperación de información booleano con expansión semántica de consultas

Resumen. En el presente trabajo se propone una aproximación que utiliza la expansión de consultas en un Sistema de Recuperación de Información Booleano (SRIB), con la finalidad de mejorar el nivel de precisión de un SRIB sin expansión. Las consultas están formadas por los conceptos y relaciones existentes en ontoloǵıas de dominio. El SRIB sin expansión y con expansión asocia a cada consulta la ...

متن کامل

Ornitología Virtual: Caracterizando a #Chile en Twitter

Este art́ıculo presenta un análisis de los tweets recolectados el 28 de Octubre de 2012, en el contexto de las elecciones municipales de 2012 en Chile. Dicho análisis se realiza mediante una metodoloǵıa basada en literatura previa, en particular en técnicas de recuperación de la información y de análisis de espacios de información. Como resultado, se determinan: 1) caracteŕısticas demográficas b...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:
  • Procesamiento del Lenguaje Natural

دوره 31  شماره 

صفحات  -

تاریخ انتشار 2003